智能论文笔记

Biomedical image analysis competitions: The state of current participation practice

Matthias Eisenmann , Annika Reinke , Vivienn Weru , Minu Dietlinde Tizabi , Fabian Isensee , Tim J. Adler , Patrick Godau , Veronika Cheplygina , Michal Kozubek , Sharib Ali

分类：计算机视觉 | 机器学习

2022-12-16

The number of international benchmarking competitions is steadily increasing in various fields of machine learning (ML) research and practice. So far, however, little is known about the common practice as well as bottlenecks faced by the community in tackling the research questions posed. To shed light on the status quo of algorithm development in the specific field of biomedical imaging analysis, we designed an international survey that was issued to all participants of challenges conducted in conjunction with the IEEE ISBI 2021 and MICCAI 2021 conferences (80 competitions in total). The survey covered participants' expertise and working environments, their chosen strategies, as well as algorithm characteristics. A median of 72% challenge participants took part in the survey. According to our results, knowledge exchange was the primary incentive (70%) for participation, while the reception of prize money played only a minor role (16%). While a median of 80 working hours was spent on method development, a large portion of participants stated that they did not have enough time for method development (32%). 25% perceived the infrastructure to be a bottleneck. Overall, 94% of all solutions were deep learning-based. Of these, 84% were based on standard architectures. 43% of the respondents reported that the data samples (e.g., images) were too large to be processed at once. This was most commonly addressed by patch-based training (69%), downsampling (37%), and solving 3D analysis tasks as a series of 2D tasks. K-fold cross-validation on the training set was performed by only 37% of the participants and only 50% of the participants performed ensembling based on multiple identical models (61%) or heterogeneous models (39%). 48% of the respondents applied postprocessing steps.

translated by 谷歌翻译

On the Convergence Theory of Meta Reinforcement Learning with Personalized Policies

Haozhi Wang , Qing Wang , Yunfeng Shao , Dong Li , Jianye Hao , Yinchuan Li

分类：人工智能 | 机器学习

2022-09-21

现代的元强化学习（META-RL）方法主要基于模型 - 不合时宜的元学习开发，该方法在跨任务中执行策略梯度步骤以最大程度地提高策略绩效。但是，在元RL中，梯度冲突问题仍然很少了解，这可能导致遇到不同任务时的性能退化。为了应对这一挑战，本文提出了一种新颖的个性化元素RL（PMETA-RL）算法，该算法汇总了特定任务的个性化政策，以更新用于所有任务的元政策，同时保持个性化的政策，以最大程度地提高每个任务的平均回报在元政策的约束下任务。我们还提供了表格设置下的理论分析，该分析证明了我们的PMETA-RL算法的收敛性。此外，我们将所提出的PMETA-RL算法扩展到基于软参与者批评的深网络版本，使其适合连续控制任务。实验结果表明，所提出的算法在健身房和Mujoco套件上的其他以前的元rl算法都优于其他以前的元素算法。

translated by 谷歌翻译

Safety-Enhanced Autonomous Driving Using Interpretable Sensor Fusion Transformer

Hao Shao , LeTian Wang , RuoBing Chen , Hongsheng Li , Yu Liu

分类：计算机视觉 | 人工智能 | 机器学习 | 机器人

2022-07-28

由于安全问题，自动驾驶汽车的大规模部署已不断延迟。一方面，全面的场景理解是必不可少的，缺乏这种理解会导致易受罕见但复杂的交通状况，例如突然出现未知物体。但是，从全球环境中的推理需要访问多种类型的传感器以及多模式传感器信号的足够融合，这很难实现。另一方面，学习模型中缺乏可解释性也会因无法验证的故障原因阻碍安全性。在本文中，我们提出了一个安全增强的自主驾驶框架，称为可解释的传感器融合变压器（Interfuser），以完全处理和融合来自多模式多视图传感器的信息，以实现全面的场景理解和对抗性事件检测。此外，我们的框架是从我们的框架中生成的中间解释功能，该功能提供了更多的语义，并被利用以更好地约束操作以在安全集内。我们在Carla基准测试中进行了广泛的实验，我们的模型优于先前的方法，在公共卡拉排行榜上排名第一。

translated by 谷歌翻译

TensorIR: An Abstraction for Automatic Tensorized Program Optimization

Siyuan Feng , Bohan Hou , Hongyi Jin , Wuwei Lin , Junru Shao , Ruihang Lai , Zihao Ye , Lianmin Zheng , Cody Hao Yu , Yong Yu

分类：机器学习 | 人工智能

2022-07-09

在各种设备上部署深度学习模型已成为一个重要的话题。硬件专业化的浪潮为多维张量计算带来了一套多样化的加速度原始图。这些新的加速原始基原料以及新兴的机器学习模型带来了巨大的工程挑战。在本文中，我们提出了Tensorir，这是一种编译器抽象，用于通过这些张量计算原始素优化程序。Tensorir概括了现有机器学习编译器中使用的循环巢表示，以将张量计算作为一流的公民。最后，我们在抽象之上构建了一个端到端框架，以自动优化给定的张量计算原始图的深度学习模型。实验结果表明，Tensorir编译会自动使用给定硬件后端的张量计算原始图，并提供与跨平台的最新手工精制系统竞争性能的性能。

translated by 谷歌翻译

CoBEVT: Cooperative Bird's Eye View Semantic Segmentation with Sparse Transformers

Runsheng Xu , Zhengzhong Tu , Hao Xiang , Wei Shao , Bolei Zhou , Jiaqi Ma

分类：计算机视觉

2022-07-05

Bird's Eye View（BEV）语义分割在自动驾驶的空间传感中起着至关重要的作用。尽管最近的文献在BEV MAP的理解上取得了重大进展，但它们都是基于基于摄像头的系统，这些系统难以处理遮挡并检测复杂的交通场景中的遥远对象。车辆到车辆（V2V）通信技术使自动驾驶汽车能够共享感应信息，与单代理系统相比，可以显着改善感知性能和范围。在本文中，我们提出了Cobevt，这是可以合作生成BEV MAP预测的第一个通用多代理多机构感知框架。为了有效地从基础变压器体系结构中的多视图和多代理数据融合相机功能，我们设计了融合的轴向注意力或传真模块，可以捕获跨视图和代理的局部和全局空间交互。 V2V感知数据集OPV2V的广泛实验表明，COBEVT实现了合作BEV语义分段的最新性能。此外，COBEVT被证明可以推广到其他任务，包括1）具有单代理多摄像机的BEV分割和2）具有多代理激光雷达系统的3D对象检测，并实现具有实时性能的最新性能时间推理速度。

translated by 谷歌翻译

Multiple Instance Learning with Mixed Supervision in Gleason Grading

Hao Bian , Zhuchen Shao , Yang Chen , Yifeng Wang , Haoqian Wang , Jian Zhang , Yongbing Zhang

分类：计算机视觉

2022-06-26

随着计算病理学的发展，通过整个幻灯片图像（WSIS）的Gleason评分的深度学习方法具有良好的前景。由于WSIS的大小非常大，因此图像标签通常仅包含幻灯片级标签或有限的像素级标签。当前的主流方法采用了多个实体学习来预测格里森等级。但是，某些方法仅考虑幻灯片级标签，忽略了包含丰富本地信息的有限像素级标签。此外，考虑到像素级标签的另外方法忽略了像素级标签的不准确性。为了解决这些问题，我们根据多个实例学习框架提出了一个混合监督变压器。该模型同时使用幻灯片级标签和实例级别标签，以在幻灯片级别实现更准确的Gleason分级。通过在混合监督培训过程中引入有效的随机掩盖策略，进一步降低了实例级标签的影响。我们在SICAPV2数据集上实现了最新性能，视觉分析显示了实例级别的准确预测结果。源代码可从https://github.com/bianhao123/mixed_supervision获得。

translated by 谷歌翻译

Federated Spatial Reuse Optimization in Next-Generation Decentralized IEEE 802.11 WLANs

Francesc Wilhelmi , Jernej Hribar , Selim F. Yilmaz , Emre Ozfatura , Kerem Ozfatura , Ozlem Yildiz , Deniz Gündüz , Hao Chen , Xiaoying Ye , Lizhao You

分类：人工智能 | 机器学习

2022-03-20

随着无线标准的发展，引入了更复杂的功能，以解决吞吐量，延迟，安全性和效率方面的增加。为了释放此类新功能的潜力，目前正在利用人工智能（AI）和机器学习（ML）（ML）来从数据中得出模型和协议，而不是通过手工编程。在本文中，我们探讨了将ML应用于下一代无线局域网（WLAN）的可行性。更具体地说，我们专注于IEEE 802.11AX空间重用（SR）问题，并通过联合学习（FL）模型来预测其性能。在这项工作中概述的FL解决方案集是2021年国际电信联盟（ITU）AI的5G挑战赛的一部分。

translated by 谷歌翻译

PandaSet: Advanced Sensor Suite Dataset for Autonomous Driving

Pengchuan Xiao , Zhenlei Shao , Steven Hao , Zishuo Zhang , Xiaolin Chai , Judy Jiao , Zesong Li , Jian Wu , Kai Sun , Kun Jiang

分类：计算机视觉 | 机器人

2021-12-23

自动驾驶技术的加速开发对获得大量高质量数据的需求更大。标签，现实世界数据代表性是培训深度学习网络的燃料，对于改善自动驾驶感知算法至关重要。在本文中，我们介绍了PANDASET，由完整的高精度自动车辆传感器套件生产的第一个数据集，具有无需成本商业许可证。使用一个360 {\ DEG}机械纺丝利达，一个前置，远程LIDAR和6个摄像机收集数据集。DataSet包含100多个场景，每个场景为8秒，为目标分类提供28种类型的标签和37种类型的语义分割标签。我们提供仅限LIDAR 3D对象检测的基线，LIDAR-Camera Fusion 3D对象检测和LIDAR点云分割。有关Pandaset和开发套件的更多详细信息，请参阅https://scale.com/open-datasets/pandaset。

translated by 谷歌翻译

RoboAssembly: Learning Generalizable Furniture Assembly Policy in a Novel Multi-robot Contact-rich Simulation Environment

Mingxin Yu , Lin Shao , Zhehuan Chen , Tianhao Wu , Qingnan Fan , Kaichun Mo , Hao Dong

分类：机器人 | 人工智能 | 计算机视觉 | 机器学习

2021-12-19

部件组件是机器人中的典型但具有挑战性的任务，机器人将一组各个部件组装成完整的形状。在本文中，我们开发了用于家具组件的机器人组装仿真环境。我们将零件装配任务制定为混凝土加固学习问题，并提出了一种机器人的管道，以学习组装多种椅子。实验表明，当使用看不见的椅子进行测试时，我们的方法在以上对象的环境下实现了74.5％的成功率，并在完整环境下实现了50.0％。我们采用RRT-CONNECT算法作为基线，在计算时间明显更长的时间后，只能实现18.8％的成功率。我们的项目网页提供了补充材料和视频。

translated by 谷歌翻译

TransMIL: Transformer based Correlated Multiple Instance Learning for Whole Slide Image Classification

Zhuchen Shao , Hao Bian , Yang Chen , Yifeng Wang , Jian Zhang , Xiangyang Ji , Yongbing Zhang

分类：计算机视觉

2021-06-02

多实例学习（MIL）是一种强大的工具，可以解决基于整个滑动图像（WSI）的病理学诊断中的弱监督分类。然而，目前的MIL方法通常基于独立和相同的分布假设，从而忽略不同实例之间的相关性。为了解决这个问题，我们提出了一个被称为相关的MIL的新框架，并提供了融合证明。基于此框架，我们设计了一种基于变压器的MIL（TMARMIL），其探讨了形态和空间信息。所提出的传输可以有效地处理不平衡/平衡和二元/多重分类，具有良好的可视化和可解释性。我们对三种不同的计算病理问题进行了各种实验，与最先进的方法相比，实现了更好的性能和更快的会聚。在CAMELYON16数据集中的二进制肿瘤分类的测试AUC最高可达93.09％。在TCGA-NSCLC数据集和TCGA-RCC数据集中，癌症亚型分类的AUC分别可以高达96.03％和98.82％。实现可用于：https://github.com/szc19990412/transmil。

translated by 谷歌翻译